我们经常会在SCI文章里面看到下面这样的图来,展示体细胞突变(somatic mutation)的数据。
这个图叫瀑布图,展示每一样本中的各种类型的突变,包括错义突变,移码突变,无义突变,插入缺失等等。要想画出这张图,首先我们必须要准本好数据。今天小编就来跟大家聊聊怎么从TCGA数据库下载体细胞突变(somatic mutation)数据。
1.打开TCGA网站,输入需要下载的肿瘤类型
2.点击WXS后面的数字51
3.点击左上角File
4.选择WXS,Masked Somatic Mutation,maf,simple nucleotide variation,Aliquot Ensemble Somatic Variant Merging and masking,然后Add all files to cart
5.这51个文件就加入右上角的购物车里面了
6.下载Download下拉框里里面的Cart
得到gdc_downloa_****.tar.gz.文件
7. 解压该文件
8. 合并所有数据
setwd("G:\\test\\gdc_download_20221025_103238.659115")files